iT邦幫忙

2024 iThome 鐵人賽

DAY 13
0
生成式 AI

懶人救星:生成式AI 系列 第 13

Day13-LlamaIndex 🦙全解析:從資料讀取到多輪對話,一網打盡!

  • 分享至 

  • xImage
  •  

LlamaIndex🦙

今天的主題是 LlamaIndex 的主要功能介紹, LlamaIndex 集成了 Chatbot 中的大部分應用,從QA、多輪對話到 Agent,大致可分為以下模組:
https://ithelp.ithome.com.tw/upload/images/20240911/20168117a43y349PeT.png

(圖片來源: PowerPoint DIY)

🌟Loading

  • 透過 Llama Hub 支援多種資料來源,如本地文件、網頁、資料庫等。

  • 提供 LlamaParse 支援多種文件格式,並提供OCR、圖片讀取、轉換輸出格式(如Markdown, Json...)等功能。(免費額度每天1000頁)

  • 提供異步載入管道,支援大規模資料處理。

  • 支援元數據(Metadata)提取,增加檢索效果。


⚙️Model

  • LLMs

    • 支援多種雲端LLM,如OpenAI、Anthropic、Cohere、Azure OpenAI等。
    • 支援多種開源LLM,如Llama, Mistral, Zephyr等模型。
    • 支援多種量化模型、硬體加速方式,如Llama CPP, vllm加速等。
  • Embedding

    • 支援多種雲端、開源模型,如ada, bge等。
  • Multi Modal

    • 支援雲端多模態LLM,如GPT-4V、Gemini。

🛠️Prompts

  • 支援自定義 Prompt 模板,可用於各類型任務、問答等,包含QA、refine、text-to-sql等。


🗂️Indexing

  • 支援多種索引方式,如向量索引、關鍵詞索引等。

  • 提供分布式索引,支援大規模資料索引。

  • 支援元數據提取,方便使用者快速提取Summary、Keyword、Entity等資訊。


💾Storing

  • 支援多種VectorDB,如ChromaDB、Qdrant、Pinecone。

  • 支援Index/Document Stores,如MongoDB、Redis。默認情況下,這些資訊會存儲在記憶體中。

  • 支援Chat Stores多輪對話歷史資料儲存。
    https://ithelp.ithome.com.tw/upload/images/20240910/20168117zpBv1vzyLF.png

    (圖片來源:Llamaindex)

🔎Querying

  • 支援多種檢索方式,如BM25 Retrieval、Embedding Retrieval等。

  • 提供檢索結果優化,如Reranker、Filter等。

  • 提供更多進階查詢方法,如Router、SQL、Sub-Question等。


🧪Evaluation

  • 支援多種生成評估指標,如正確性、幻覺等。

  • 支援多種檢索評估指標,如精確度、命中率等。


🤖Agents

  • 支援多種代理模型,如聊天機器人、問答系統等

  • 提供可控代理,支援任務分解、結果解釋等

  • 支援代理微調,提升代理性能


🎯結論

LlamaIndex 模組化了 LLMs 的整個框架,從檔案讀取到Agent、評估效果一條龍的開發流程,能透過簡短的程式碼快速更換各種模型、檢索器、儲存桶等,大幅減少了開發者的研發時間消耗。接著筆者將會針對各項功能更深入的一一介紹,有興趣的朋友歡迎一起討論。

/images/emoticon/emoticon37.gif


上一篇
Day12-LlamaIndex或LangChain,該選哪一個?
下一篇
Day14-從零開始:如何透過LlamaIndex讀取檔案(上)?
系列文
懶人救星:生成式AI 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言